血浆代谢组学识别关键代谢物并改善糖尿病视网膜病变的预测:跨国队列的开发与验证
GDES 是广州糖尿病眼病研究(Guangzhou Diabetic Eye Study)的英文缩写。该研究中,GDES 队列纳入 638 名接受代谢组学分析的参与者,为研究提供外部验证和外推分析数据。通过标准化的 7 视野眼底照片和修订的 ETDRS 分级标准评估糖尿病视网膜病变(DR),借助 OCT 血管造影观察视网膜微血管系统变化,进而助力探索 DR 相关代谢物指纹在预测 DR 发生、进展及视网膜微血管损伤中的作用。
目的:识别糖尿病视网膜病变(DR)的纵向代谢组学特征,并评估其在预测DR发生和进展中的作用。
设计:多中心、多民族队列研究。
参与者:本研究纳入了17,675名来自英国生物样本库(UKB)的参与者,这些参与者在基线时患有糖尿病前期或糖尿病(根据2021年美国糖尿病协会指南确定),且基线时无糖尿病视网膜病变(DR);另外纳入了638名来自广州糖尿病眼病研究(GDES)的2型糖尿病参与者,用于外部验证。在UKB队列中,糖尿病视网膜病变通过ICD-10代码确定,而在GDES队列中则通过修订的ETDRS分级标准确定。
方法:通过对UKB参与者进行核磁共振(NMR)检测,识别出糖尿病视网膜病变(DR)的纵向代谢组学特征。在完全保留的测试集中评估这些特征对预测DR发生的预测价值。使用NMR技术在GDES队列中对DR进展和微血管损伤进行外部验证和外推分析。模型评估包括两个队列中的一致性(C)统计量、净分类改善(NRI)、综合判别改善(IDI)、校准和临床实用性。
主要观察指标:糖尿病视网膜病变(DR)的发生和进展以及视网膜微血管损伤。
结果:在168种代谢物中,118种被确定为未来糖尿病视网膜病变(DR)发生的候选代谢组学特征。这些特征显著提高了DR发生的预测能力,优于传统指标(C统计量:0.802[95%置信区间(CI),0.760~0.843] vs.0.751[95%CI,0.706~0.796];(P=5.56×10^{-4}))。葡萄糖、乳酸和柠檬酸是在GDES队列中验证的特征之一。在外部GDES队列中,使用这些简洁且可重复的特征在预测DR发生(C统计量:0.807[95%CI,0.711~0.903] vs.0.617[95%CI,0.494~0.740];(P=1.68×10^{-4}))和进展(C统计量:0.797[95%CI,0.712~0.882] vs.0.665[95%CI,0.545~0.784];(P=0.003))方面也取得了类似的改善。两个队列中的净分类改善(NRI)、综合判别改善(IDI)和临床实用性也均有明显提升(均(P<0.05))。此外,在中国GDES队列中,乳酸和柠檬酸与黄斑和视盘区域的微血管损伤相关(均(P<0.05))。
结论:代谢组学分析可能有助于识别可靠的生物标志物,以预测糖尿病视网膜病变(DR)的未来发生和进展,为DR病理生理学的早期和晚期阶段提供新的见解。
然而,现有的 DR 发病或进展的危险因素往往被证明是不够充分的预测因子,并且遗传学研究的成果也有限。因此,迫切需要可靠的新型风险标志物来应对早期 DR 的发生和进展问题。
代谢组学被认为是人体生理学的直接反映,在疾病预测和临床转化方面具有巨大潜力。[5,6] 然而,其在糖尿病视网膜病变(DR)预测中的应用仍较为匮乏。既往DR代谢组学研究存在以下局限:(1)样本量较小;(2)采用横断面设计;(3)研究人群种族单一;(4)缺乏外部验证;(5)忽视糖尿病前期人群;(6)需要有创性眼内采样;(7)未采用标准DR诊断和分级方法;(8)与深入眼部表型的关联不足,这些因素均阻碍了研究成果的转化和实际应用。[7-18] 我们假设,通过跨队列验证的DR纵向代谢组学特征可能有助于阐明早期DR的病理生理学机制,并促进对其发生和进展的预测。
方法
研究设计
英国生物样本库(UKB)研究是一项前瞻性多中心队列研究,在2006年至2010年间从英格兰、苏格兰和威尔士的22个评估中心招募了超过50万名40至69岁的参与者。在当前分析中,我们排除了未完成合格代谢组学分析的参与者((n=391746))、缺乏医院记录的参与者((n=18032))、不符合糖尿病或糖尿病前期诊断标准的参与者((n=75011))以及基线时已知患有糖尿病视网膜病变(DR)的参与者((n=12))。当前分析共纳入12,483名糖尿病前期参与者和5,192名糖尿病参与者。另外,从广州糖尿病眼病研究(GDES)中纳入638名接受代谢组学分析的参与者,用于外部验证和外推分析。
代谢组学分析
本研究采用高通量质子核磁共振(NMR)平台(Nightingale Health)对两个队列参与者的血浆样本进行代谢物浓度定量分析,具体步骤及结果如下: 1. 样本处理:将冷冻保存的乙二胺四乙酸(EDTA)血浆样本解冻并离心,取上清液与磷酸盐缓冲液混合。 2. NMR检测:将制备好的样本加载到冷却的自动进样器中,使用500-MHz NMR光谱仪(Bruker AVANCE IIIHD)对UKB队列样本进行检测,使用600-MHz NMR光谱仪(Bruker AVANCE IIIHD)对GDES队列样本进行检测,每个血浆样本记录两张NMR光谱。其中一张光谱主要表征蛋白质和脂质脂蛋白颗粒产生的共振,另一张光谱用于检测低分子量代谢物。 3. 代谢物定量:使用Nightingale Health生物标志物定量库2020对总共168种代谢物进行定量,这些代谢物包括脂肪酸、糖酵解代谢物、酮体、氨基酸、脂质和脂蛋白等。对于GDES参与者,有117种代谢物可用于验证。
糖尿病前期、糖尿病及糖尿病视网膜病变的确定
由于糖尿病代谢紊乱在临床明显的糖尿病出现之前就会影响视网膜,因此患有糖尿病和糖尿病前期的参与者均有患糖尿病视网膜病变(DR)的风险,并被纳入筛查阶段。根据2021年美国糖尿病协会指南,糖尿病前期的定义为存在空腹血糖受损、糖化血红蛋白(HbA1c)在5.7%至6.4%(39-47 mmol/mol)之间,或同时存在这两种情况。糖尿病的定义为:在触摸屏问卷调查中自我报告经医生诊断、使用胰岛素或降糖药物,或糖化血红蛋白达到6.5%及以上(48 mmol/mol),具体如前所述。研究采用了多种策略来减轻因糖尿病类型异质性引起的混杂(补充方法,可在www.aaojournal.org获取)。
在英国生物样本库(UKB)队列中,糖尿病视网膜病变(DR)的确定基于《国际疾病分类(第十版)》中的编码H360。在广州糖尿病眼病研究(GDES)队列中,通过散瞳后获取的7个标准视野的立体彩色眼底照片来确定DR。DR特征的变化量按先前描述的方法计算(补充方法)。糖尿病视网膜病变状态根据修订的ETDRS分级标准进行分级,并相应地赋予严重程度评分(补充方法)。新发DR定义为从无DR状态进展至任何程度的DR,而DR进展则定义为在随访期间DR严重程度恶化2级及以上。
光学相干断层扫描血管造影(OCTA)
散瞳后,广州糖尿病眼病研究(GDES)的参与者在每次随访时均使用 swept-source 光相干断层扫描血管成像(OCTA)系统(DRIOCT Triton;拓普康)进行视网膜光学血管造影,以显示视网膜微血管系统。研究采用了两种扫描模式:以中央凹为中心的血管黄斑6×6毫米扫描模式,以及以视盘(ONH)为中心的血管视盘6×6毫米扫描模式,这两种模式分别有助于观察黄斑和视盘微血管系统的纵向变化。使用内置软件(IMAGEnet 6版本1.22)进行自动图像分割,将黄斑区域分为浅层毛细血管丛和深层毛细血管丛,将视盘区域分为放射状视盘周围毛细血管、浅层毛细血管丛和深层毛细血管丛。
经过预先设定的质量控制和放大效应校正流程后,研究人员进行了定量分析,以计算血管密度(VD)、血管骨架密度、血管直径指数和黄斑无血管区参数(补充方法)。旁中心凹血管密度通过计算4个ETDRS内圈象限的血管密度平均值确定,而中心凹周围血管密度则通过计算4个ETDRS外圈象限的血管密度平均值确定。快速微血管损伤定义为在相应亚区域中,纵向血管密度下降速率处于最高四分位数的参与者。
协变量
对所有参与者进行了面对面访谈和全面的触摸屏问卷调查,收集了年龄、性别、种族、吸烟状况和病史等信息。同时还获取了基线身体和生化指标,包括体重指数(BMI)、收缩压(SBP)、高密度脂蛋白胆固醇水平、总胆固醇水平和糖化血红蛋白(HbA1c)水平。对于糖尿病前期参与者,其糖尿病病程按0年计算。
数据分析
数据分析采用R 4.2.2版本软件(R统计计算基金会)进行。连续变量以均数±标准差表示,分类变量以数量(百分比)表示。分别采用Student t检验和卡方检验比较连续变量和分类变量。为确保代谢物之间的可比性,对所有代谢物浓度进行z评分标准化。
参与者按8:2的比例被随机分配至发现集和测试集。分别采用多变量Cox比例风险模型和逻辑回归模型,评估循环代谢物与糖尿病视网膜病变(DR)风险、DR特征变化量及视网膜微循环之间的关联,模型均校正了年龄、性别、糖化血红蛋白(HbA1c)水平、糖尿病病程、体重指数(BMI)和收缩压(SBP)——这些均为已知的与DR风险相关的因素。[46,47]
为进一步减轻种族多样性[48-50]和基线合并症[51,52]可能导致的混杂偏倚,本研究开展了多项敏感性分析,具体包括:(1)额外校正种族因素;(2)排除所有非白人参与者;(3)额外校正血清肌酐水平;(4)排除基线患有心血管疾病、慢性肾病或同时患有这两种疾病的参与者;(5)在所有分析前排除血糖控制不佳的参与者(HbA1c≥9.0% [75 mmol/mol])。
为解决多重检验问题,采用Benjamini-Hochberg法控制假发现率,达到显著性水平的代谢物被视为候选DR代谢组学特征。通过Schoenfeld残差法检验比例风险假设,所有模型均满足该假设。
糖尿病视网膜病变(DR)代谢组学状态模型在发现集上采用弹性网络正则化回归进行训练,这是一种广泛应用于疾病预测的有监督机器学习算法。[53-55] 在完全独立的测试集上进行模型评估。为评估DR代谢组学特征对DR发生和进展风险的预测能力,计算了一致性(C)统计量,并与各个常规指标的统计量进行比较。将这些特征的附加预测能力与3个公认的DR预测模型(Aspelund模型、[56] Hippisley-Cox和Coupland模型、[57] Rhee模型[58])的预测因子组合进行比较评估。这些预测因子包括年龄、性别、糖化血红蛋白(HbA1c)水平、糖尿病病程、收缩压(SBP)、体重指数(BMI)、总胆固醇水平、高密度脂蛋白胆固醇水平和吸烟状态。同时计算了净重新分类指数(NRI)和综合判别改善指数(IDI)。采用Hosmer-Lemeshow检验评估模型拟合优度,并通过决策曲线分析评估其临床应用价值。在广州糖尿病眼病研究(GDES)队列中进行的外部验证也采用了相同的方法。
结果
基线数据特征
研究设计的工作流程如图1所示。共有17675名英国生物样本库(UKB)参与者符合条件,用于筛选与糖尿病视网膜病变(DR)相关的代谢物,并构建代谢组学弹性网络模型以预测新发DR。该研究人群的中位年龄为56.8岁(标准差8.1岁),其中54.5%为女性。在超过202900人年的随访中,共有570名参与者出现DR,其中发现集440名,测试集130名(表S1,可在www.aaojournal.org获取)。随访期间出现DR的参与者在基线时具有年龄较大、男性、体重指数(BMI)较高、糖化血红蛋白(HbA1c)水平较高、收缩压(SBP)较高及血清肌酐水平较高的特征(表2),这与典型的流行病学研究结果一致。
代谢相关DR风险
在发现集中,经过多重检验校正后,168种代谢物中有118种与新发糖尿病视网膜病变(DR)风险相关。其中,7种代谢物呈正相关,111种代谢物呈负相关。
关联性最强的正相关代谢物包括乳酸(风险比[HR] = 1.188;95%置信区间[CI] = 1.091-1.294;(P=7.26×10^{-5}))、葡萄糖(HR = 1.245;95%CI = 1.183-1.310;(P=5.63×10^{-17}))和丙氨酸(HR = 1.276;95%CI = 1.181-1.373;(P=6.00×10^{-11})); 而关联性最强的负相关代谢物包括总游离胆固醇(HR = 0.714;95%CI = 0.657-0.776;(P=1.96×10^{-15}))、总酯化胆固醇(HR = 0.711;95%CI = 0.657-0.770;(P=3.69×10^{-17}))以及脂蛋白成分(HR范围 = 0.687-0.909;95%CI = 0.631-0.748至0.832-0.992;均(P<0.05))(图2A;表S3,可在www.aaojournal.org获取)。敏感性分析得出了一致的结果(表S4-S11,可在www.aaojournal.org获取)。
在独立队列中的重复验证
在独立的广州糖尿病眼病研究(GDES)队列中,经过超过2600人年的随访,106名符合条件的参与者出现了糖尿病视网膜病变(DR)。
在调整了与英国生物银行(UKB)队列相同的协变量后,葡萄糖(风险比1.388,95%置信区间1.126-1.711,P=0.002)、乳酸(风险比1.300,95%置信区间1.053-1.605,P=0.014)和柠檬酸盐(风险比1.264,95%置信区间1.022-1.564,P=0.031)与 incident DR 风险显著相关。
将这些代谢物添加到传统风险因素模型中,GDES队列预测 incident DR 的一致性(C)统计量从0.617(95%置信区间0.494-0.740)提高到0.807(95%置信区间0.711-0.903,P=1.68×10⁻⁴),净重新分类改善(NRI)为0.352(95%置信区间0.110-0.594,P=0.004),综合鉴别改善(IDI)为0.064(95%置信区间0.033-0.095,P<0.001),临床实用性也有明显提升。
在该研究中,C statistic(一致性统计量) 是用于评估模型预测糖尿病视网膜病变(DR)发生和进展准确性的重要指标,其本质与受试者工作特征曲线下面积(AUC)类似,取值范围在 0.5 到 1 之间。
糖尿病视网膜病变的进展与微血管损伤
除了在糖尿病视网膜病变(DR)发病风险中的作用外,这3种代谢物还与DR进展相关(葡萄糖:风险比1.439[95%置信区间1.182-1.752;P=2.89×10⁻⁴];乳酸:风险比1.270[95%置信区间1.044-1.544;P=0.017];柠檬酸盐:风险比1.253[95%置信区间1.025-1.532;P=0.027],详见表S13,可访问www.aaojournal.org获取),并且与特定DR特征的变化相关,包括微动脉瘤和棉絮斑(详见表S14和S15,可访问www.aaojournal.org获取)。
将这些代谢物纳入模型后,对DR进展的预测能力和临床实用性进一步提高(一致性统计量从0.665提升至0.797[95%置信区间从0.545-0.784提升至0.712-0.882;P=0.003];净重新分类改善为0.450[95%置信区间0.206-0.693;P<0.001];综合鉴别改善为0.064[95%置信区间0.027-0.102;P=0.002],见图3C、E)。
在调整相同的协变量后,乳酸和柠檬酸盐与黄斑浅层毛细血管丛的快速视网膜微血管损伤相关(表16)。此外,乳酸还与视神经头(ONH)区域的浅层、深层及放射状视盘周围毛细血管灌注的快速微血管损伤存在关联(表16)。 根据ETDRS协议对视网膜进行进一步细分后,获得了糖尿病视网膜病变(DR)相关代谢物与特定视网膜亚区关联的更精确见解(表S17,可在www.aaojournal.org获取),例如乳酸与黄斑浅层灌注在鼻上内层、鼻下内层、颞上外层、颞下外层和鼻侧外层亚区的损伤相关。这些代谢物与其他光学相干断层扫描血管造影(OCTA)参数的关联汇总于表S18(可在www.aaojournal.org获取)。
讨论
本研究在患有前驱糖尿病和糖尿病的大型欧洲人群中,识别出了与糖尿病视网膜病变(DR)纵向发展相关的候选代谢组学特征,这些特征改善了风险预测效果和临床实用性。
随后,在一个独立的中国南方人群中验证了这些已识别特征与DR发生和进展风险的前瞻性关联。该人群接受了标准化的7视野眼底摄影检查,并采用修订后的ETDRS分级标准,以确保DR诊断和分级的准确性。仅使用简洁且可重复的特征(即葡萄糖、乳酸和柠檬酸盐),就在DR发生和进展的预测以及临床实用性方面取得了类似的改善效果。此外,这些特征还与通过光学相干断层扫描血管造影(OCTA)量化的视网膜微血管损伤存在关联,这进一步证实了它们在DR发病机制中的相关性。
质子核磁共振(Proton NMR)光谱技术是一种可高度重复且定量的代谢组学平台,能够同时对多种代谢物进行评估。在核磁共振光谱中,峰值可可靠地对应特定代谢物,且峰值强度与参与的核数量直接成正比。 与质谱等其他技术相比,核磁共振技术几乎不存在批次效应,所需的样本制备步骤极少,并且能以相对较低的成本实现高通量检测。该平台已在多项具有里程碑意义的研究中得到应用,涉及全因死亡率、癌症、心血管疾病、2型糖尿病、阿尔茨海默病以及2019冠状病毒病等领域,通过提供超越生物标志物本身、直达机制层面的见解,为疾病诊断和治疗策略的完善提供了帮助。
本研究是首次在生物银行规模的多队列中探索代谢组学分析预测糖尿病视网膜病变(DR)风险的潜力。尽管可供直接比较的研究有限,但在英国生物银行(UKB)队列中识别出的与DR风险相关的候选代谢物,与以往的横断面研究结果相符。例如,组氨酸作为自由基清除剂肌肽的前体,因其抗氧化特性而被认可,这表明它可能通过减轻炎症和氧化应激对DR起到保护作用。 然而,脂蛋白成分在DR中的作用仍不明确,因为脂蛋白级联反应涉及持续的动态变化,这使得对每个单独成分的评估变得复杂。大多数候选代谢组学特征在外部验证中未达到显著水平,尽管其中许多特征的关联方向得到了重复。
在跨队列中得到可靠验证的这些代谢组学特征,为糖尿病视网膜病变(DR)的发病机制和病理生理特征提供了既有已知又有新颖的见解。 高血糖会触发多元醇通路,产生晚期糖基化终产物并引发氧化应激。乳酸主要由糖酵解产生,其存在提示三羧酸循环受阻和线粒体功能障碍,使得丙酮酸转向乳酸生成。此外,已有研究表明,细胞内乳酸积累增多会激活G蛋白偶联受体,后者下调蛋白激酶A和第二信使信号,最终破坏视网膜内皮细胞屏障的结构和功能,导致DR微血管功能障碍。而乳酸会促进视网膜微血管损伤这一观察结果,进一步证实了上述观点。 然而,柠檬酸盐是三羧酸循环的重要中间产物。据推测,三羧酸循环成分的改变也是DR中能量代谢紊乱的标志。
近年来的研究强调了微血管改变在糖尿病视网膜病变(DR)发生和进展中的作用。通过使用最先进的光学血管造影技术,研究率先将代谢组学特征与纵向微血管损伤联系起来,发现乳酸和柠檬酸盐与黄斑和视盘缺血均存在显著关联。这一发现强化了关于DR发病机制的既定假设,特别是高血糖诱导的微血管损伤,包括周细胞和内皮细胞凋亡以及直接血管损伤。 此外,根据ETDRS协议将视网膜细分为不同亚区后,发现DR相关代谢组学特征与视网膜灌注存在亚区特异性关联。例如,乳酸会加重每个视盘毛细血管丛鼻侧内层亚区的缺血,而所有视盘层面的鼻下内层亚区似乎未受影响。未来的研究有必要进一步阐明这些与代谢相关的微循环变化在DR发病机制中的意义。
我们进行了受试者工作特征分析和决策曲线分析,以评估代谢组学特征对未来糖尿病视网膜病变(DR)的预测价值。将这些特征整合到已建立的风险因素模型中,提高了C统计量和临床实用性,这表明其捕捉到了传统因素量化范围之外的残余风险。 值得注意的是,在独立队列中仅使用简洁且可重复的特征时,也取得了类似的改善效果,这凸显出与复杂的代谢组学特征相比,这些简洁特征具有更优的临床转化潜力。此外,在广州糖尿病眼病研究(GDES)队列中,利用基于修订后的ETDRS标准的标准化DR分级,能够对DR进展进行外推分析,而英国生物银行(UKB)队列仅能提供DR的二元诊断,无法进行此类分析。 我们的结果表明,同样这些简洁的特征不仅与任何DR进展相关,还能进一步提高对DR进展的预测能力和临床实用性,这提示它们在早期和进展期DR的潜在发病机制中均发挥着共同作用。
本研究的优势包括:(1)样本量达到生物银行规模且随访期长;(2)纳入了前驱糖尿病患者;(3)进行了独立的跨种族验证;(4)采用标准化的糖尿病视网膜病变(DR)诊断和分级;(5)深入关联了微血管表型;(6)简洁的代谢组学特征具有成本效益适用性和临床转化潜力。 同时,也应承认研究存在一定局限性。首先,英国生物银行(UKB)队列中DR的诊断依赖医疗记录,这可能低估DR的患病率,尤其是无症状的早期病例。不过,任何潜在偏倚更可能削弱关联而非夸大关联。此外,在具有严格DR分级的外部队列中进行的验证,证实了研究结果的稳健性。其次,由于缺乏适用于 swept-source OCTA 模块上中间毛细血管丛分割的高通量自动化软件,为避免手动分割引入偏倚,本研究未进行中间毛细血管丛分割。第三,两个队列的代谢组学分析均基于单次样本采集,可能无法捕捉随时间的波动。最后,与所有观察性研究一样,尽管已努力调整已知混杂因素,但仍不能完全排除潜在的残余混杂因素。
总之,本研究利用两个大规模前瞻性队列的数据,凸显了代谢组学分析在识别可预测未来糖尿病视网膜病变(DR)发生和进展的可靠特征方面的潜力,并为DR早晚期的病理生理特征提供了宝贵见解。未来有必要开展涵盖更广泛代谢物且包含重复测量的研究,以验证和拓展我们的发现。